Es interesante la carrera por la presidencia en muchos países. En algunos casos por ideales o luchas políticas con un discurso (real o no) que va dirigido a la gente de sus correspondientes países. Algunos son democrátricos, otros no tantos, pero algo en común es mencionar la lucha contra la pobreza y la desigualdad económica. No obstante, ¿esto aplica en sus sueldos? ¿los países que mantienen una gran pobreza también lo reflejan sus presidentes o solo queda todo en un discurso?
Para responder esto buscamos datos relacionados a los ingresos de los presidentes o representates del gobierno en 2021 los cuales exploraremos con distintos gráficos. Cabe resaltar que varios países presentan tanto un Presidente como un Primer ministro. Los datos los puedes encontrar aquí y para extreaerlos realizamos un script en Python usando web scrapping para tener lo datos en un archivo y tener una mejor manipulación.
En algunos casos observamos que en lugar de Presidente existe el dato de primeros ministros pero en el caso de Siria hay un sueldo pero no se indica con exactitud que posición es la que esta registrada.
Para completar más nuestros datos podemos agregar la categoría de Continente.
En esta sección exploraremos los datos correspondientes de Presidentes o Representante del país para ver el rango y variación de los sueldos reportados por año. Para esto aprovecharemos el gráfico de boxplot con la columna correspondiente a los continentes ya nos permite ver la distribución de los datos. Además, representamos el sueldo en Millones.
Aqui observamos un problema, ya que con la escala normal, los valores extremos recorren todos los puntos de la gráfica y no se logra observar la distribución de los otros puntos. Si no tenemos cuidado en la escala parecería que todos los demás puntos (Presidentes o Representates de Estado) ganan $0 lo cual es una interpretación incorrecta.
Para estos casos, podemos aplicar una escala logarítmica lo que nos permite ver estos cambios grandes entre los puntos. Cabe destacar que son 3 puntos los que causan todo este cambio.
La otra opción es generar intervalos o bins que nos permitar agrupar por el sueldo que mantienen y que nos sera útil para categorizar, por ejemplo, en mapas.
Con los mapas podemos representar regiones geográficas, o en este caso en particular, representar por color cada unos de los países si que presentan la información adecuada. Para ello, podemos usar la paquetería maps que contiene las coordenadas de los países para usarlos en ggplot2. Aqui, en nuestra opinión, es conveniente ultilizar variables categóricas ya que se evita el problema con los países que presentan un valores muy lejanos a otros puntos. Además, se puede apreciar cuales son los países con rangos similares.
El mapa con la varible continua se veria de la siguiente manera:
El problema de esta gráfica es que los valores extremos afectan la escala continua de colores ocultando todos los demás valores, como en los graficos anteriores. También tenemos la opción de obtener el logaritmo pero veamos como se visuzaliza generando los rangos.
Con la variable categorica se puede ver mejor los paises que se encuentran en el mismo rango sin embargo, el detalle será en como se definan los rangos, si son proporcionales o no.
Para completar nuestra exploración de datos trataremos de realizar el mismo gráfico pero interactivo.
Uno de los principales problemas de realizar gráficos de mapas es tener el nombre correcto de los países por lo que debemos verificar si los nombres van de acuerdo al dataset de R o de sus paqueterías. Una vez que los nombres de los países coincidan se puede realizar el gráfico con la paqueteria highcharter
En esta sección exploramos los datos de los primer ministros (o Representantes del Gobierno). En los casos en el que no se presente un dato es muy probable que no tengan primer ministro y el presidente es quien cubra esa área.
Al igual que con los Presidentes, usamos el gráfico de boxplot. Utilizando la escala normal se ve una mejor distribución de los datos comparado con lo obseravado en Presidentes. No obstante, sigue existiendo puntos con un elevado sueldo a comparación del resto de los países.
Para ver una mejor distribución se puede realizar la escala exponencial.
Se puede observar que el primer ministro con mayor sueldo es de Singapore.
Al igual que ene la sección anterior, a partir de una varaible númerica se crean intervalos. Con los datos en un formato adecuado se puede representar en un mapa.
Como observamos en la sección anterior, muchos países no presentan un primer ministro, ya que el Presidente es quién cubre el Estado y Gobierno. Para poder tener un panorama más general, comparando los sueldos de los principales representandes de cada país (ya sean presidentes o primeros ministros), en la preparación de los datos se creó una columna con el valor de Presidente en caso de no tener un primer ministro.
Para representar esta nueva organización de datos, podemos hacer el gráfico de boxplot o solamente los puntos, mantentiendo la escala exponencial.
Por ejemplo, aqui se resalta cual es el representante con el major sueldo en cada continente.
Con los datos en un formato adecuado podemos ahora realizar los mapas junto con la representación de las categorías.
Y también mediante un mapa interactivo.
Por último, con todo esta preparación de datos, generamos una infografía construida con ggplot2 para mostrar todos los detalles que se mueden mostrar. Este gráfico lo puedes ver aqui.